ЗАПАСНЫХ ЭЛЕМЕНТОВ
ПРИ РАНДОМИЗИРОВАННЫХ РЕШЕНИЯХ
Оптимальные решения, полученные с учетом дополнительных ограничений, например, на вероятность отказа вида (3.29), имеют важную особенность — элементы рандомизации, которая требует модификации методики определения количества ЗЭ. Это обусловлено тем фактом, что при построении фундаментальной матрицы
(5.9) не ясно, относить или не относить состояние с элементами рандомизации к области оптимальной остановки.
Рассмотрим приближенные способы оценки количества ЗЭ при рандомизации. Пусть матрица решений D имеет рандомизированные элементы Dn и Du= 1 — Dix в состоянии і. Остальные элементы являются нерандомизированными; в область оптимальной остановки строго входят те элементы, для которых k>i.
I. Опишем процесс восстановления при появлении рандомизации решений. Пусть в состоянии / с вероятностью Dn осуществляется восстановление, причем после его проведения состояние имеет номер 1. Это означает, что среднее время работы функционального элемента соответствует случаю, когда область оптимальной остановки включает состояние і. Обозначим такое среднее время через Ті, а дисперсию этого времени через оД
При принятии решения типа Dn среднее время работы необходимо определять для случая, когда область оптимальной остановки уменьшается и содержит состояния i+1,…, F. Обозначим для этого случая среднее время как 7Vh, а дисперсию как а2+1. Таким образом, с вероятностью Dn среднее время до поглощения (т. е. до попадания в зону оптимальной остановки) равно Ті и с вероятностью Dn — Ti+. Тогда на основании теоремы о полном математическом ожидании среднее время до поглощения для управляемого процесса с рандомизированной матрицей решений.
г,=ад+(1-А,)г<+1. (5.11)
Очевидно, что в каждом из этих случаев существует своя функция распределения времени до поглощения. Обозначим соответствующие плотности вероятностей через fi(t) и fi+x(t). На основании теоремы о полной вероятности
/а{t)—Dnf і (^)-J-(l — On) f i+1 (^).
Дисперсия времени до поглощения при рандомизации
°!= ] (t — Тя)2 /а (/) dt—Dn j +
—оо —ОО
+(1-£>п) ] (t-TsYfi+x(t)dt.
— оо
Опуская промежуточные выкладки, получим
°!=°?Аі+°?+і(1-А1ЖІ-А-1) Da(Ti+l—Ti)2. (5.12)
Из выражения (5.12) следует, что дисперсия времени до поглощения с учетом рандомизации складывается из взвешенных дисперсий ‘времени до попадания в зоны оптимальной остановки, когда эти зоны соответственно включают и не включают состояние с ран — чомизацией, и слагаемого, зависящего от разности средних времен для этих же зон.
Выражения (5.11) и (5.12) позволяют, используя (5.8), приближенно вычислять необходимое количество запасных элементов:
«I (*)=— + «„ у. з/2 • (5- 13)
II. Другой способ решения задачи связан с получением оценок верхней и нижней границ числа ЗЭ. Заменим матрицу D двумя матрицами D++ и D+. Матрица D++ получается из D путем выбора элемента Du— 1. Это означает, что состояние і с вероятностью единица включается в область оптимальной остановки. Введем неран- чомизированную матрицу D+, у которой Dn = 0. После замены матрицы D на D+ и D++ (см. § 5.2) можно получить значения п++ и //’, соответствующие матрицам D++ и D+. Очевидно, что п++ будет верхней, а п+ — нижней границей для истинного количества ЗЭ, еоответствующего Дп>0, т. е. п++>я>я+, причем границы определяются с заданной гарантийной вероятностью. Однако эти границы являются достаточно широкими, и было бы желательно иметь бо — Iее точные оценки. Такие оценки можно построить на основе интерполяции, исходными данными для которой являются значения //|+, п+ и Du. Допустимость такой интерполяции обусловлена монотонным изменением числа ЗЭ в пределах [п+, и++] при 0<Dfld. Вследствие того, что кроме граничных значений п и вероятности /і, і никакой информации больше нет, наиболее целесообразно применить линейную интерполяцию. В этом случае оценка истинного числа ЗЭ
«П = я++(«++ — п+) Dn — п++— (л+* — я+)(1— Dn). (5.14)
Описанный способ получения оценок количества ЗЭ может быть использован при введении ограничения, учитывающего неполное восстановление (3.37). В этом случае типовая матрица решения имеет вид
/1……………… ‘
.1…………………….
. . 1 . . . .
. . . 1 . .
DFlDf2 ■ ■ ■)
Элементы матрицы DF-tDf2=. Сделаем состояние F логлощаю — щнм и, используя методику § 5.2, вычислим фундаментальную матрицу, векторы и т2, а затем рассчитаем на основе (5.8) число
запасных элементов. Особенность этого расчета будет состоять в том, что величина n(1) будет определяться при 7"=т<Н и о2=т^1)5 а для оценки будут использоваться Т=т*2) и о2=т<2), т. е. значение среднего числа шагов до попадания в поглощающее состояние и его дисперсия при условии, что начальное состояние/= —Q. При таком выборе исходных данных и(1> будет нижней оценкой, а «(2>—верхней оценкой числа запасных элементов. Далее, используя линейную интерполяцию по типу (5.14), оценим число запасных элементов с учетом рандомизации решений:
п = n!»Dn _|_ «(2) [ 1 — — Dfl] == я<2> — (я<2> — я<4) Df
В случае если область оптимальной остановки содержит более одного элемента, необходимо использовать алгоритм построения матрицы с поглощением и расчета ее параметров (см. § 5.2). Если матрица решений имеет не два, а больше элементов рандомизации
в строке (например DFi, і— 1, 2,…, F — то, рассуж-
дая по аналогии, можно показать, что оценкой числа запасных эле-
F-Г
ментов является величина п= ^ n<-‘WFi. где n(i)—число запасів і
ных элементов, полученное при использовании в качестве исходных данных для (5.8) значений Г,- и о,-2, соответствующих г’-му началь — ному состоянию.
Очевидна возможность обобщения описанного подхода при совместном использовании ограничений (3.29) и (3.37), когда необходимо вычислять значения Г и о2 с одновременным учетом начального состояния и области оптимальной остановки.
III. Еще один способ решения задачи основан на применении метода Монте-Карло. При этом способе моделируется управляемый процесс, описываемый матрицами вероятностей переходов Q и решений D (имеющей элементы рандомизации). На заданном интервале [О, /] (достаточно большом по сравнению со средним временем попадания из начального состояния в область оптимальной остановки) подсчитывается количество восстановлений (замен) п. Моделирование повторяется многократно (fc>l), что позволяет получить набор случайных величин (nh, k = l, К). Проводя статистическую обработку полученного массива {nh}, можно найти закон распределения, оценки среднего значения п и дисперсии аэт2 количества замен на интервале [о, а соответствующие фиксированной матрице решений D, а следовательно, и необходимое количество запасных элементов.